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@ Personenidentifikation mit Bewegungsinformation 

(57) Das technische Gebiet der Erfindung ist die Personeniden- 
tifikation. Es wird vorgeschlagen, die Bewegungsinformation 
aus Bidsequenzen aus2uwerten, die sich ergeben, wenn ein 
typischer oder vorgegebener Bewegungsablauf (2; 2a, 2b. 
2c, 2d, 2e) der zu identifizierenden Person ausgefuhrt wird. 
Der erwahnte Bewegungsablauf wird aufgezeichnet und 
mittels eines synergetischen Computers ausgewertet, urn 
hohe Sicherheit bei der Erkennung zu erhalten. Ton- und 
statische Bildinformation konnen begleitend ausgewertet 
werden. 
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Beschreibung 



Das technische Gebiet der Erfindung ist die Persone- 
nidentifikation mittels Auswertung von Informationen, 
die der Person an sich anhaften und ohne Verwendung 
von Hilfsmitteln, wie Ausweise, Schliissel oder Geheim- 
zahlen. 

Das sichere Erkennen — und damit das Identifizieren 

— von Personen ist nach wie vor technisch ungelost. 
Derzeitige Ansatze gehen davon aus, daB sich Personen 
uber Hilfsmittel identifizieren Beispiele dafur sind der 
oft gefalschte Ausweis, die verlorengegangenen Schlus- 
sel oder die allzu haufig vergessene Geheimzahl). Auch 
Passworter haben im heutigen Leben nur eine kurze 
Lebensdauer, da sie entweder zu einfach gestaltet sind 
oder von unberechtigten Personen leicht in Erfahrung 
gebracht werden konnen. Gerade die zuletzt genannte 
Gefahr tritt haufig dann auf, wenn man eilig eine Zu- 
gangsberechtigung benotigt und das eingegebene (ver- 
meintlich richtige) Passwort nicht funktionierL 

Sicher Identifizierung von Personen heiBt aber auch: 
Schutzen eines lokalen Bereiches gegen unberechtigten 
Zutritt. Beispiele hier sind militarische Anlagen oder 
gefahrdete Bereiche in Kernkraftwerken. Auch der Zu- 
tritt zu Informationen, wie Akten oder Geheimdienstin- 
formationen, die in unserem Zeitalter zunehmend Be- 
deutung erlangen, fordert eine genau abgestimmte Zu- 
gangsberechtigung fur Personen, abhangig von ihrer 
Zuverlassigkeit und ihrem Kompetenzbereich. 

Der Stand der Technik kennt die Analyse statischer 
Bilder, so der Gesichtserkennung, der Erkennung von 
Handabdrucken oder die Analyse von Fingerabdrucken. 
Aufgrund der starken Varianz im Aussehen der Person 
als auch der Schwierigkeit, reproduzierbare Aufnahme- 
bedingungen zu schaffen, zeigen diese Systeme eine 
"Ungenauigkeit", die noch so hoch ist, daB von einer 
"sicheren Personenerkennung" nicht gesprochen wer- 
den kann. Sicher kann eine Personenerkennung nur 
dann werden, wenn sie mit (nahezu) 100%iger Sicher- 
heit arbeitet. 

Scheinbar mit einer Bildsequenz befaBt sich die EP 82 
304 Bt ; die Bildsequenz, die dort Anwendung findet, ist 
aber nicht mehr als eine Vorstufe, urn das geeignete 
Momentanbild (Einzelbild) zu lokalisieren und in einem 
iiblichen statistischen Vergleichsverfahren mit vorab 
gespeicherter Information zu vergleichen. Urn das dort 
als "Schlusselereignis" bezeichnete Momentanbild w&h- 
rend des Sprechens eines Schliisselwortes aufzufinden, 
werden akustisch gewonnene Energiesignale ausgewer- 
tet und bei Oberschreiten eines Schwellenwertes das 
relevante Einzelbild aus der fortwahrend aufgezeichne- 
ten Sequenz ausgesondert, festgehalten und ausgewer- 
tet. Zur Auswertung dient die Verzerrung eines auf den 
Lippenbereich projizierten Linien- oder Gittermusters 
zum Zeitpunkt des Schlusselereignisses. Also liegt dort 
eine — mit akustischer Signalauswertung kombinierte 

— Einzelbildauswertung vor. 

Die Erfindung schiagt zur Erreichung einer sicheren 
Personenidentifizierung dagegen die technische Lehre 
des Anspruches 1 von Sie wird erganzt und konkreti- 
siert mit den Lehren der abhangigen Anspriiche 2 bis 7. 
Unabhangig davon schlagt die Erfindung zur Implemen- 
tierung der vorgenannten Verfahren einen synergeti- 
schen Computer vor (Anspruch 10). Das Lern verfahren 
zur Erstellung von kontrasterhohenden Adjungierten 
des Audio- und des optischen Merkmalsvektors ist Ge- 
genstand des Anspruchs 8. Der Audio- Merkmalsvektor 
kann iiber eine FFT aus dem Spektrogramm; der opti- 



sche Merkmalsvektor kann ebenfalls uber eine FFT aus 
dem optischen FluB berechnet werden (Anspruch 9). 

Anstelle des statischen Bildes des Standes der Tech- 
nik verwendet die Erfindung Bildsequenzen (Bildfol- 
5 gen). Diese Bildfolgen definieren die Bewegungsinfor- 
mationen, die uber die B.erechnung eines optischen Flus- 
ses (vgL Fig. 6 oder Fig. 7) ausgewertet wird. Urn die 
Auswertung sicher zu gestalten, wird ein typischer oder 
ein vorgegebener Bewegungsablauf verwendet, dessen 
io Bildsequenzen ausgewertet und mit Vergleichswerten 
. verglichen werden. Vor einem Vergleich kann eine Da- 
tenreduktion mittels eines Klassifizierungs-Verfahrens 
erfolgen (Anspruch 7), mit der eine Filterung groBer 
Datenmengen moglich ist. 
15 Die Erfindung, wie sie in ihrem Anspruch 1 mit ihren 
maBgeblichen Merkmalen umrissen ist, wertet die Se- 
quenz von Bildern aus, in der das Einzelbild "untergeht" 
Ein typischer Bewegungsablauf kann eine Gang- oder 
Kopfbewegung sein (Anspruch 3); ein vorgegebener 
20 Bewegungsablauf kann die Bewegung eines Gesichtes 
oder eines Teilbereiches eines Gesichtes (Gesichtszuge) 
sein, die beim Sprechen eines vorgegebenen Wortes 
oder Satzes entsteht (Anspruch 2). Die typischen und 
vorgegebenen Bewegungsablauf e konnen vortenhah 
25 kombiniert werden (Anspruch 4). Die Auswertung der 
[Combination kann parallel oder ineinander verschach- 
telt verlaufen. Zusatzlich zur Bildsequenz-Information 
kann die Auswertung von statischer Bild-lnforrnation 
eingesetzt werden (Anspruch 5). 
30 Die Bildsequenz-Information und die Auswertung 
von statischer Bild-Information kann mit der Auswer- 
tung akustischer Information erganzt werden (An- 
spruch 6), um die Zuverlassigkeit (weiter) zu erhdhen. 
Ein synergeuscher Computer zur Realisierung des Er- 
35 kennungsverfahrens im vorgenannten Sinn ist Gegen- 
stand des Anspruches 10; er ist z. B. in einem Tagungs- 
band der Tagung in Innsbruck (April 1 993, Seiten 206 bis 
212) naher erlautert; allerdings nicht fur den Zweck des 
Anspruchs 10. Der Titel dieser Druckschrift ist "Using a 
40 Synergetic Computer in an Industrial Classification Pro- 
blem"; Gegenstand der Tagung und Name des Tagungs- 
bandes ist "Artificial Neural Networks and Genetic Al- 
gorithms". Insbesondere unter der dortigen Ziffer 2 wird 
die hinter einem solchen synergetischen Computer ste- 
45 hende Theorie erlautert, bei der einer der speziellen 
Algorithmen auf die Losung einer Matrixinversion zu- 
ruckgefuhrt werden kann, anstelle der Integrauon eines 
Systems von Differentialgleichungen. Vorgeschlagen 
wird auch, neurale Netzwerke zu verwenden. Das dorti- 
50 ge Anwendungsgebiet war die Erkennung von Kfz-Fel- 
gen, die einem GieB- oder SpritzguB- Verfahren ent- 
stammen. Dabei verbleiben Reste von Aluminium (oder 
anderem Metall) an den Felgen, die eine genaue Erfas- 
sung erschweren. Hinzu kommt, daB die Position der zu 
55 erfassenden Felgen ebenso wie die Orientierung vielfal- 
tig und dem System nicht bekannt ist. 

Auf einer anderen Konferenz IECON 1992 in San 
Diego, California, vom 9. bis zum 13. November 1992 ist 
in einem Vortrag von Yamasaki und Takahashi ein 
60 adaptives Tonerfassungs-System vorgeschlagen wor- 
den, bei dem visuelle Effekte erganzend herangezogen 
wurden, um auch in der (technischen) Erkennungstech- 
nik den (humaneigenen) Xocktailparty-Effekt" zu reali- 
sieren. Dieser Effekt auBert sich dadurch, daB ein 
65 Mensch in der Lage ist, mit seinen Sinnen trotz eines 
erheblichen Hintergrundgerausches und eines sehr 
schlechten S/R-Verhaltnisses (S/N-Ratio) bestimmte 
ihn interessierende Information herauszufiltern. Diese 
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menschliche Eigenschaft ist heute weder genau er- 
forscht noch kann sie in der hohen Qualitat technisch 
reproduziert werden. Ziel des vorgenannten Vortrages 
war es also, ein Tonsignal von einer Quelle (einem ge- 
sprochenen Satz von einer Person) aus einer Vieizahl 
von unterschiedlichen Umgebungsgerauschen heraus- 
zufiltern und dabei das Signal/Rausch-Verhaitnis zu 
verbessern. Als Anwendungsgebiet nennt der Vortrag 
die Erfassungvon fehlerhaften Maschinenkomponenten 
(durch Erkennen "seltsamer" Gerausche) oder die Erfas- 
sung von menschlichen Stimmen in larmender Umge- 
bung (als Mensch/Maschine-Interface, bei dem eine 
Person der Maschine auf akustischem Wege mitteilt, 
welche weiteren Schritte sie einsetzen soli). Die im Vor- 
trag erwahnte Technik verwendet neben akustischen 
Informationen optische Informationen und verbindet 
diese beiden Informationsquellen, so daB eine "Sensor- 
Fusion" entsteht. Die Verbindung der beiden Informa- 
tionen erfolgt in zwei Ebenen, einem Ton-Untersystem 
und eine Visual-Untersystem. 

Anders als die vorgenannten Ansatze verwendet die 
Erfindung maBgeblich eine Bildsequenz und den opti- 
schen FluB zur Erreichung einer sicheren (hochgenau- 
en).Personenidentifikation. Erst zusatzlich konnen aku- 
stische Informationen herangezogen werden oder stati- 
sche Bilder ausgewertet werden, 

Das Verstandnis der Erfindung soil an einem Ausfuh- 
rungsbeispiel vertieft werden. 

Fig. 1 zeigt ein Beispiel der visuellen und akustischen 
Erfassung von Informationen, die von einer schematisch 
dargestellten Person 2 ausgehen. 

Fig. 2 veranschaulicht einen vorgegebenen Bewe- 
gungsablauf anhand von (schematisch in Folge darge- 
stellten) Gesichtsztigen 2a bis 2e iiber der (senkrecht 
verlaufenden) Zeitachse t. Die Gesichtszuge werden 
von einer Hochgeschwindigkeitskamera 10 aufgezeich- 
net. 

Fig. 3 ist eine Darstellung des optischen Auswertep- 
fades, mit dem die Bildsequenzen verarbeitet werden, 
namentlich iiber ein FluBvektor-Feld und ein solches 
mit reduzierter Aufidsung hin zu einem hochdimensio- 
nalen Merkmalsvektor, der in ein Klassifikationsverfah- 
ren eingespeist wird. Das fClassifikationsverfahren kann 
in einem synergetischen Computer programmiert sein. 

Fig. 4 ist ein mit Fig. 3 korrespondierender akusti- 
scher Auswertepfad, in dem die akustischen Signale di- 
gitalisiert und als Spektrogramm dargestellt werden. 
Der Weg fuhrt auch hier iiber einen eindimensionalen 
Merkmalsvektor, der in ein fClassifikationsverfahren 
eingespeist wird, das in einem synergetischen Computer 
programmiert sein kann. 

Fig. 5 zeigt die Kombination der beiden Auswerte- 
verfahren, wobei die optische und akustische Vorverar- 
beitung als Blockschaltbild jeweils diejenigen Auswer- 
teschritte der Fig. 3 bzw. 4 beinhalten, die vor dem ein- 
dimensionalen Merkmalsvektor liegen. Die Ausgangssi- 
gnale der optischen Klassifikation und der akustischen 
Klassifikation werden in einer Verkniipfung 20 zusam- 
mengefaBt und ergeben das Auswertesignal E, das bei 
Verwendung zur Personen-Identifikation die Aussage 
ist, ob die das Kennwort sprechende Person eine der 
vorgespeicherten Personen ist. 

Die Fig. 6 veranschaulicht anhand einer Lippenfolge 
beim Sprechen einer Person den Bewegungsablauf, der 
zum optischen FluB von der Schaltung gemaB Fig. 3 
umgesetzt wird. Die weiBen Richtungspfeile sind cha- 
rakteristisch fur die Bewegung bestimmter Bereiche der 
Lippengegend. 
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Fig. 7a, 7b und 7c veranschaulichen einen beispielhaf- 
ten anderen Bewegungsablauf, hier zwei Bilder einer 
aufgezeichneten Bildsequenz und das sich daraus erge- 
bende FluBvektor-Feld in Fig. 7c. Deutlich ist die Bewe- 
5 gung des Balles mit Richtung und Rotation erkennbar, 
ebenso wie die Bewegung des Armes des Kindes, ob- 
wohl in den beiden nebeneinandergestellten Moment- 
anbildern gemaB Fig. 7a und 7b nahezu kein Unter- 
schied erkennbar ist. Deutlich — geradezu iiberdeutlich 
\o — wird der Bewegungsablauf also mit dem FluBvektor- 
feld gem£B Fig. 7c, das mit der Schaltung gemaB Fig. 3 
berechnet werden kann. 

In der Fig. 1 ist eine Person schematisch mit 2 darge- 
stellt. Ein vorgegebener Bewegungsablauf der Gesichts- 
15 ziige der (schematisch dargestellten) Person 2 ist in 
Fig. 2 mit 2a bis 2e veranschaulicht. 

Das System zur Erkennung der Person 2 verwendet in 
diesem Beispiel eine Hochgeschwindigkeits-Kamera 10, 
die auf die Person 2 gerichtet ist, sowie ein Mikrofon 12, 
20 das Sprachsignale aufzeichnen kann. Die optischen Si- 
gnale der Kamera 10 und die Tonsignale des Mikrofons 
12 werden einer Ansteuerelektronik 1 1 zugeflihrt. Diese 
Ansteuerelektronik 11 kann die Signale so aufbereiten, 
daB sie einem Rechner 1 zur Auswertung zugefuhrt 
25 werden konnen, Dabei ist es sowohl moglich, der An- 
steuerelektronik bereits Analog/Digitalwandler bei zu- 
geben als auch diese Analog/Digitalwandler in der Aus- 
werteeinheit 1 selbst anzuordnen, so daB die Koppiun- 
gen zwischen den Bildinformations-Quellen 10 und 12 
30 auf analoger Basis vorgenommen werden. 

Der Verfahrensablauf im Beispiel der Fig. 1 und 2 
beginnt mit der Vorgabe eines Wortes, Satzes oder 
Kennwortes, z. B. dem Namen der zu erkennenden Per- 
son. Die Hochgeschwindigkeits-Kamera 10 und das Mi- 
35 krofon 12 nehmen die dabei entstehenden Signale 
gleichzeitig auf und leiten sie der Ansteuerelektronik 11 
zu. Beim Sprechen des Wortes oder Satzes werden die 
Bewegungen des Gesichts oder eines Teilbereiches da- 
von aufgezeich.net. Ein Klassifikationsverfahren ist in 
40 der Auswerte-Einheit programmiert, urn zu groBe Da- 
tenmengen auf ein auswertbares MaB zu reduzieren. 
Zuvor oder danach wird der optische FluB der Gesichts- 
mimik errechnet und anhand von Vergleichswerten mit 
hoher Sicherheit eine der "gespeicherten Personen" wie- 
45 dererkannt. Wird keine Ubereinstimmung zwischen den 
vorgespeicherten Daten und der den Zugang oder Zu- 
tritt anfordernden Person erkannt, so besteht die Mog- 
lichkeit der Wiederholung der vorgenannten Vorge- 
hensweise. Bei hoheren Sicherheitsstufen kann es auch 
so ratsam sein, diese Wiederholung nicht vorzunehmen 
und die Berechtigung sogleich abzulehnen. 

Detaillierter ergibt sich die Auswertung in der Aus- 
werteeinheit 1 dadurch, daB der optische FluB aus der 
Bildsequenz der Hochgeschwindigkeitskamera 10 be- 
55 rechnet wird, der die Bewegungsinformation in kompri- 
mierter Form — jedoch nicht beliebig genau — wieder- 
gibt. Die Bewegungsinformation setzt sich dabei aus 
einer Mehrzahl von Abtastwerten der GesichtszOge zu- 
sammen, so daB fiktive Punkte des Gesichts eine be- 
60 stimmte Bewegung oder Bewegungskurve beschreiben, 
die mit dem optischen FluB (vgl. Horn und Schunk, "De- 
termining Optical Flow" Artificial Intelligence. Vol. 17, 
1981, Seiten 185 bis 203) festgelegt werden. Die akusti- 
schen Daten werden mit einer Kurzzeit-Fourier-Trans- 
65 formation (FFT) ausgewertet, um die vorhandene Fre- 
quenzinformation adaquat darzustellen. 

Das in der Auswerteeinheit 1 programmierte Verfah* 
ren und die Ansteuerelektronik 11 der Fig. 1 und 2 fin- 
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den sich in den Fig, 3, 4 und 5 wieder. EingangsgroBe in 
Fig. 3 ist das optische Signal fiber die Kamera 10, Aus- 
gangsgroBe ist eine erkannte Person oder ein Erken- 
nungssignai Eb. EingangsgroBe in Fig. 4 ist ein akusti- 
sches Signal fiber das Mikrofon 12, AusgangsgroBe ist 5 
das Erkennungssignal Ea. Beide AusgangsgroBen k6n- 
nen in einer Verknupfung 20 kombiniert werden und 
bilden das Ausgangssignal E, das fur eine erkannte Per- 
son stehen karin. Die Verkniipfung 20 kann als einfaches 
UND-Gatter ausgestaltet sein. 10 

Das in Fig. 3 dargestellte optische Verarbeitungssy- 
stem verarbeitet eine echte Bildsequenz und diese Bild- 
sequenz reprasentiert sich in dem eindirnensionalen 
Merkmalsvektor, der dem Klassifikationsverfahren zu- 
geleitet wird Die aufeinanderfoigenden Bilder der Ka- 15 
mera 10 werden in eine digitale Bildsequenz umgesetzt, 
aus ihnen wird ein FluBvektor-Feld (FluBsequenz) er- 
rechnet, die anhand der Fig. 6 und 7 noch erlautert wird; 
die FluBsequenz ist ein Bild von Vektorpfeilen. Diese 
entstandene FluBsequenz wird umgesetzt in eine solche 20 
mit reduzierter Auflosung (Mittelung), um die Daten- 
menge zu beschranken. 

Die FluBsequenz mit reduzierter Auflosung kann 
nochmals fouriertransformiert werden, wenn eine Lage- 
Invarianz des Bildes oder der Person erwiinscht ist. 25 

Das Ergebnis ist der eindimensionale Merkmalsvek- 
tor, der der Klassifikation zugefiihrt wird und aus dem 
das Erkennungssignal Eb abgeleitet ist 

In vergleichbarer Weise arbeitet die akustische Aus- 
wertung gemaB Fig. 4. Das digitalisierte Akustiksignal 30 
bildet ein Spektrograrnm, bei dem die hohen Amplitu- 
den hell dargestellt sind und die geringen Amplituden 
dunkel erscheinen. Jede Linie ist reprasentativ fur eine 
Abtastzeit 

Auch hier kann eine Koordinaten-Transformation er- 35 
folgen, fur akustische Signale bietet sich eine logarithmi- 
sche Transformation an. Mittels dieser Transformation 
erreicht man eine Tonhdhen-Invarianz, die vergleichbar 
ist mit der Lagelnvarianz bei der optischen Auswertung 
gemaB Fig. 3. 40 

Der eindimensionale Merkmalsvektor, der fur die 
akustischen Signale gemaB Fig. 4 gebildet wird, wird 
der Klassifikation uberreicht, die daraus das Ausgangs- 
signal Ea bildet 

Die Klassifikations-Verfahren der Fig. 3 und 4 kon- 45 
nen auf einem synergetischen Computer programmiert 
sein. 

Die Kombination der Verfahren gemaB Fig. 3 und 4 
ist in Fig. 5 dargestellt. Jede Datenquelle (akustisch, op- 
tisch) extrahiert auf dem beschriebenen Weg geeignete 50 
Merkmale, die die akustische Information bzw. die Bild- 
sequenz-Information bestmdglich reprasentieren. Diese 
Merkale werden in den eindirnensionalen Zahlenvekto- 
ren festgehalten und der Klassifikation zur Bildung der 
Ausgangssignale Eb oder Ea ubergeben. 55 

Bevor auf die Auswertung in der Klassifikation und 
den dort auch programmierten Lernalgorithmus einge- 
gangen wird, soli der optische FluB anhand der Fig. 6 
und 7a, 7b bzw. 7c erlautert werden. 

Der optische FluB in Fig. 6 ist z. B. derjenige eines 60 
Lippenbereiches. Fiktive Punkte haben die weiB darge- 
stellten Bewegungen, die hinsichtlich Lange und Rich- 
tung ausgewertet werden konnen. Bei der Bewegung 
sind im wesentlichen nur Vektoren des entstehenden 
FluBvektor-Feldes zu erkennen, die in vertikaler Rich- 65 
tung verlaufen. Anders ist der Sachverhalt bei einer Ro- 
tationsbewegung, beispielsweise des Balles gemaB 
Fig. 7a, 7b. Dort ist in dem FluBvektor-Feld der Fig. 7 
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erkennbar, daB der Ball rotiert. Die FluBvektoren sind 
also in der Lage, jede Bewegung von fiktiven Punkten 
auszuwerten und selbst bei statischen, kaum erkennba- 
ren Unterschieden, deutliche Vektoren aufzuzeigen, die 
den Bewegungsablauf festlegen und markant beschrei- 
ben konnen. 

Ebenfalls erkennbar ist die Bewegung des Armes des 
Kindes und des Knies des Kindes, das in den Fig. 7a und 
7b dargestellt ist. Der Kopf ist nahezu unbeweglich. 

In den Fig. 3, 4 und 5 ist ein Lernalgorithmus angege- 
ben. Er dient der Festiegung der bestimmten, dem Sy- 
stem bekannten Personen. Bei einem solchen Lernver- 
fahren auf einem synergetischen Computer wird entwe- 
der fur den optischen oder fur den akustischen Informa- 
tionspfad die Vielzah! der Merkmale, die fur jede Klasse 
berechnet worden ist, zu adjungierten Prototypen um- 
gerechnet. Fur jede Klasse — jede Klasse entspricht 
einer Person — existiert ein adjungierter Prototyp. Die- 
se Adjungierte hat die Eigenschaft, diejenigen Merkma- 
le in der Bewertung stark zu berucksichtigen, die signifi- 
kante Unterschiede zwischen einzelnen Klassen (einzel- 
nen Personen) aufzeigen, wahrend andere Merkmale, 
die in alien Klassen nahezu gleich sind, stark unter- 
druckt werden. Sie ist "kontrastbildend". 

Mittels des Lernverfahrens werden die adjungierten 
Prototypen berechnet, diese adjungierten Prototypen 
ermoglichen die zielstrebige Klassifikation von noch un- 
bekannten optischen oder akustischen Merkmalsvekto- 
ren. 

Ist das Lernverfahren einmal ausgefuhrt und besteht 
ein Datensatz an Klassen, so konnen zu erkennende 
Personen (ein zu klassifizierender Merkmalsvektor oder 
ein zu klassifizierendes Muster) leicht erkannt werden. 
Der Merkmalsvektor wird gemaB den Schaltungen von 
Fig. 3 und Fig. 4 bzw. Fig. 5 erstellt und dann der Klassi- 
fikation ubergeben, die auf die gelernten Klassen zu- 
ruckgreifen kann. 

Die bereits gelernten adjungierten Prototypen, die 
die Eigenheiten jeder einzelnen Klasse (jeder einzelnen 
Person) zum Ausdruck bringen, werden im Klassifika- 
tionsmodus dann dem noch unbekannten Merkmalsvek- 
tor zugeordnet und als "schon dagewesen" erkannt oder 
als unbekannt zuruckgewiesen. 

Eine vorteilhafte Erganzung dieser Sequenz- und 
Akustik-Auswertungen bildet die Auswertung von Ein- 
zelbildern der aufgezeichneten Bildsequenz. Als geeig- 
nete Einzelbilder haben sich das Anfangs- und Endbild 
eines kurzen Zeitabschnittes erwiesen, in dem die dyna- 
mische Erkennung erfolgt; sie konnen zusatzlich als In- 
formationsquelie fur die Festiegung der zu identifizie- 
renden Person herangezogen werden. 

Werden alle drei Datenquellen kombiniert, so kdnnen 
diese drei Sensor- Eingangssignale in ein Klassifikations- 
Verfahren eingegeben werden, das wie zuvor erlautert 
arbeitet 

Die vorerwahnte Verfahrensweise zur Erkennung 
von Personen hat in einem Versuchsaufbau ergeben, 
daB unabhangig von der Umgebungsbedingung (Hin- 
tergrund, Skalierung, LichteinfluB) zuverlassige Identifi- 
kationsraten erhalten werden. 

Besonders vorteilhaft ist an dem beschriebenen Ver- 
fahren, daB die zu identifizierende Person keine Hilfs- 
mittel, wie Schhissel oder Ausweise verwenden muB. 
Auch sind keine Markierungen oder Kennzeichnungen 
an der jeweiligen Person erforderlich. Die der Identifi- 
kation zugrundeliegenden Bewegungsablaufe, das Spre- 
chen von vorgegebenen Worten oder das Ausfuhren 
typischer Bewegungsablaufe, kann haufig gewechselt 
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werden, so daB eine nicht zugangsberechtigte Person 
sich auf die jeweiiige Erkennungsprobe nicht vorberei- 
teten oder einstellen kann. 

Patentanspruche 5 

1. Verfahren zur Personenidentifikation, bei dem 
Bewegungsinformation aus Bildsequenzen (Fig. 2 
oder Fig. 6), die aufgrund eines — typischen oder 
vorgegebenen — Bewegungsablaufs an bzw. von io 
der Person entstehen, aufgezeichnet (10), ausge- 
wertet und mit Vergleichswerten vergiichen wer- 
den. 

2. Verfahren nach Anspruch 1, bei dem der vorge- 
gebene Bewegungsablauf die Bewegung der Ge- is 
sichtsztige der zu erkennenden Person beim Spre- 
chen eines vorgegebenen Wortes oder Satzes ist. 

3. Verfahren nach Anspruch 1, bei dem der typische 
Bewegungsablauf eine Gang- oder Kopfbewegung 
der zu identifizierenden Person ist. 20 

4. Verfahren nach Anspruch 2 und 3, bei dem ein 
typischer Bewegungsablauf mit einem vorgegebe- 
nen Bewegungsablauf kombiniert erfaBt wird. j 

5. Verfahren nach einem der erwahnten Anspruche, 
bei dem die Auswertung des Bewegungsablaufs (ty- 25 
pisch und/oder vorgegeben) mit der Auswertung 
von statischen Bildern kombiniert wird. 

6. Verfahren nach einem der erwahnten Anspruche, 
bei dem die Auswertung der Bildsequenzen und/ 
oder der statischen Bilder mit der Auswertung von 30 
Audioinformation kombiniert (20) wird. 

7. Verfahren nach einem der erwahnten Anspriiche, 
bei dem ein Klassifikations-Verfahren vorgesehen 
ist, daB insbesondere ein Vergleich des unbekann- 
ten Merkmalsvektors mit adjungierten Prototypen 35 
ist, die aufgrund eines Lernverfahrens erhalten 
wurden. 

S. Lernverfahren fur ein Personen-Identifikations- 
verfahren, bei dem 

(a) zu einem — aus der optischen Bildsequenz 40 
(10) und dem aus dem optischen FluBvektor- 
Feld ermittelten — Merkmalsvektor eine Ad- 
jungierte errechnet wird, die als Klasse dem 
Klassifikations-Verfahren zur Verfugung 
steht;oder/und 45 

(b) aus dem akustischen Signal (12) ein Spek- 

trogramm gebildet wird, das in einen Merk- > 
malsvektor umgesetzt und zu einer Adjungier- iS> 
ten umgerechnet wird. ' 

9. Lernverfahren nach Anspruch 8, bei dem die 50 
Merkmalsvektor-Bildung uber eine zwischenge- 
schaltete Fourier-Transformation erfolgt. 

10. Verwendung eines synergetischen Computers 
fur eine Personenidentifizierung gema'B einem der 
vorhergehenden Anspruche. 55 
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